Extract, transform, load

Ve výpočetních technologiích reprezentuje zkratka ETL proces extrakce, transformace a nahrání dat z jednoho či více zdrojů do datového skladu, nebo do datového tržiště. Data mohou být extrahována z relačních databází, tabulkových procesorů a dalších strukturovaných i nestrukturovaných zdrojů dat. Po extrakci dat přichází na řadu transformace, během níž dochází k očištění dat a jejich transformaci do požadovaného stavu pro uložení do datových skladů. Takto upravená data se následně nahrají do datového skladu, který slouží jako primární zdroj dat pro BI aplikace. Data v datovém skladu jsou ukládaná v historizované podobě, což umožňuje reportovat vývoj metriky v čase.

Budování ETL systému je základním krokem tvorby datového skladu. Proces se skládá ze dvou paralelních pohledů: z pohledu plánování a projektování (angl. Planning and Design) a z pohledu toku dat (angl. Data Flow). Oba tyto pohledy jsou navzájem propojené a navzájem se ovlivňují.[1]

  1. BLŠTÁK, Michal. Aplikace procesu ETL na čištění dat v datových skladech [online]. Brno, 2016 [cit. 2018-11-28]. Dostupné z: https://is.muni.cz/th/o9b4k;. Diplomová práce. Masarykova univerzita, Fakulta informatiky. Vedoucí práce Vlastislav Dohnal.

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search